OECD ülkelerinde öğretmenlerin ders kitabını

yardımcı kaynak olarak kullanımı

 

Bu Proje için veri kümesi http://stats.oecd.org/# kaynağındaki OECD istatistiklerinden “Measuring Innovation in Education” (Eğitimde Girişimciliği Ölçme) bölümünden alınmıştır. Türü csv dosyası indirilecek şekilde seçildiği halde ancak uzantısı .txt olarak yüklenmiştir.

Bu verilerin okunması sırasında “veri içinde NULL değer olduğu” R hatası alınmıştır. Bunun üzerine read.table  komutuna skipNul = TRUE parametresi eklenmiştir.

 

> innovedu <- read.table(file = "innovation as change in classrooms.txt",header=TRUE,skipNul = TRUE,sep = ",")

> str(innovedu)

'data.frame':      3846 obs. of  1 variable:

 $ ÿşLOCATION..Country...IND...Indicator...PER...Period...GRD...Grade...FLD...Field...MSR...Measure...Value...Flag.Codes...Flags.: Factor w/ 3846 levels "AUS,\"Australia\",\"10CAU\",\"Percentage of students with computers available to use and change over time\",\"CHG\",\"Change in"| __truncated__,..: 55 56 1471 1472 1867 1868 2025 2026 2239 2240 ...

> library(dplyr)

> glimpse(innovedu)
Observations: 3,846
Variables: 1
$ ÿşLOCATION..Country...IND...Indicator...PER...Period...GRD...Grade...FLD...Field...MSR...Measure...Value...Flag.Codes...Flags. <fctr> ...
 

Sonucunda yukarıda da görüldüğü gibi 3,846 kayıt doğru olarak okunmuş, ancak nitelik sayısı bir olarak tüm kayıdı bir değer şeklinde görmüştür. Okumada sorun çıktığı için OECD formatı ile R okuma formatı örtüşmediğini farkederek için kendimiz bazı denemeler yaptık. Txt dosyasında bulunan “”” ları değiştirme, vb. sorunları çözemeyince hocamıza başvurduk. Berk hocamız OECD txt dosyasını Excel formuna dönüştürdü. Böylece R a kayıt ve nitelik sayısı read.table doğru olarak okuduk.

 

> setwd("D:/R")

> dir()

> install.packages("readxl")

> library("readxl", lib.loc="~/R/win-library/3.3")

> oecdoku <- readxl::read_excel(path = "OECDdata.xlsx")

> oecdoku

# A tibble: 3,846 × 15

   LOCATION     Country   IND

      <chr>       <chr> <chr>

1       AUS   Australia 5CLAT

2       AUS   Australia 5CLAT

3       HUN     Hungary 5CLAT

4       HUN     Hungary 5CLAT

5       ITA       Italy 5CLAT

6       ITA       Italy 5CLAT

7       JPN       Japan 5CLAT

8       JPN       Japan 5CLAT

9       NLD Netherlands 5CLAT

10      NLD Netherlands 5CLAT

# ... with 3,836 more rows, and 12 more variables:

#   Indicator <chr>, PER <chr>, Period <chr>, GRD <chr>,

#   Grade <chr>, FLD <chr>, Field <chr>, MSR <chr>, Measure <chr>,

#   Value <dbl>, `Flag Codes` <chr>, Flags <chr>

 

Veri setimizi okuttuktan sonra, sadece Türkiye verileri üzerinde çalışmayı düşündüğümüz için öncelikle Türkiye ye ilişkin kayıtları oecdTUR a aldık. Fakat kayıt sayısı az olduğu için daha sonra vazgeçtik, tüm veri setine geri döndük.

 

> install.packages("readxl") %<% library(readxl

Installing package into ‘C:/Users/alev/Documents/R/win-library/3.3’

(as ‘lib’ is unspecified)

trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.3/readxl_0.1.1.zip'

Content type 'application/zip' length 801948 bytes (783 KB)

downloaded 783 KB

 

packagereadxlsuccessfully unpacked and MD5 sums checked

 

The downloaded binary packages are in

         C:\Users\alev\AppData\Local\Temp\Rtmp4GoI2u\downloaded_packages

>          

> install.packages("readxl")library(readxl

Error: unexpected symbol in "install.packages("readxl")library"

>          

> setwd("D:/R")

> dir()

 [1] "~$eğitimi gün 2.docx"                           

 [2] "~$eğitimi.docx"                                 

 [3] "~WRL0674.tmp"                                   

 [4] "040217"                                         

 [5] "040217 2"                                       

 [6] "2.R"                                            

 [7] "ab2017-katilimcilar.csv"                         

 [8] "ab2017-katilimcilar.xlsx"                       

 [9] "ab2017-katilimcilar2.csv"                       

[10] "Aksaray Genelinde Seçim Sonuçları.pdf"          

[11] "alıştırma 2.R"                                  

[12] "Alıştırma gün 1.docx"                           

[13] "baslangıcbitis zamanı.R"                        

[14] "betikscript.R"                                  

[15] "çalışma 040217"                                 

[16] "deneme2.R"                                       

[17] "deneme3.R"                                      

[18] "dokuman_temel_alistirma.html"                   

[19] "dplyr Eğitim Dökümanı.pdf"                      

[20] "education and earnings.txt"                     

[21] "function 1.R"                                   

[22] "housing.data.txt"                               

[23] "innovation as change in classrooms 01.txt"      

[24] "innovation as change in classrooms 02.txt"      

[25] "innovation as change in classrooms TIRNAKYOK.txt"

[26] "innovation as change in classrooms TURKEY.txt"  

[27] "innovation as change in classrooms.txt"         

[28] "misafirgiriş.pdf"                               

[29] "Mustafa Baydoğan"                               

[30] "OECD datamız.xls"                               

[31] "OECD indicator.docx"                            

[32] "OECDdata.RData"                                 

[33] "OECDdata.xlsx"                                  

[34] "ornek.Rmd"                                       

[35] "pca.R"                                          

[36] "Projemiz için notlar.docx"                      

[37] "R console g?n 3.Rhistory"                       

[38] "R eğitimi gün 2.docx"                           

[39] "R eğitimi gün 3 Veri masdenciliği nedir.docx"   

[40] "R eğitimi.docx"                                 

[41] "R ile Hazır Veri Bilimcisi - ggplot2.pdf"       

[42] "Usak plot.png"                                  

[43] "veriokuma.r"                                    

> install.packages("readxl")

Installing package into ‘C:/Users/alev/Documents/R/win-library/3.3’

(as ‘lib’ is unspecified)

trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.3/readxl_0.1.1.zip'

Content type 'application/zip' length 801948 bytes (783 KB)

downloaded 783 KB

 

packagereadxlsuccessfully unpacked and MD5 sums checked

 

The downloaded binary packages are in

         C:\Users\alev\AppData\Local\Temp\Rtmp4GoI2u\downloaded_packages

> library("readxl", lib.loc="~/R/win-library/3.3")

> oecdoku <- readxl::read_excel(path = "OECDdata.xlsx")

> oecdoku

# A tibble: 3,846 × 15

   LOCATION     Country   IND

      <chr>       <chr> <chr>

1       AUS   Australia 5CLAT

2       AUS   Australia 5CLAT

3       HUN     Hungary 5CLAT

4       HUN     Hungary 5CLAT

5       ITA       Italy 5CLAT

6       ITA       Italy 5CLAT

7       JPN       Japan 5CLAT

8       JPN       Japan 5CLAT

9       NLD Netherlands 5CLAT

10      NLD Netherlands 5CLAT

# ... with 3,836 more rows, and 12 more variables:

#   Indicator <chr>, PER <chr>, Period <chr>, GRD <chr>,

#   Grade <chr>, FLD <chr>, Field <chr>, MSR <chr>, Measure <chr>,

#   Value <dbl>, `Flag Codes` <chr>, Flags <chr>

 

> oecdoku %>% filter(Country == "Turkey")

# A tibble: 56 × 15

   LOCATION Country   IND

      <chr>   <chr> <chr>

1       TUR  Turkey 6RRAT

2       TUR  Turkey 6RRAT

3       TUR  Turkey 6EAAT

4       TUR  Turkey 6EAAT

5       TUR  Turkey 6RRAT

6       TUR  Turkey 6RRAT

7       TUR  Turkey 6EWAT

8       TUR  Turkey 6EWAT

9       TUR  Turkey 6ODAT

10      TUR  Turkey 6ODAT

# ... with 46 more rows, and 12 more variables: Indicator <chr>,

#   PER <chr>, Period <chr>, GRD <chr>, Grade <chr>, FLD <chr>,

#   Field <chr>, MSR <chr>, Measure <chr>, Value <dbl>, `Flag

#   Codes` <chr>, Flags <chr>

> oecdTUR <- oecdoku %>% filter(Country == "Turkey")

> oecdTUR

 


 

Tüm OECD verileri içinde filtreleme yapmaya karar verdik. Daha sonra tüm verinin içinden ders kitabı ile ilgili olanları oecdoku içine çekip onun üzerinde çalışmaya karar verdik. IND niteliği iki tür kategori içeriyor: 8UTPR öğretmenlerin ders materyallerini öğretme sürecine temel kaynak olarak kullanması yüzdesi, 8UTSR öğretmenlerin ders materyallerini öğretme sürecine yardımcı kaynak olarak kullanması yüzdesi.

 

8UTPR: Percentage of students whose teachers use textbooks as a basis for instruction and change over time.

8UTSR: Percentage of students whose teachers use textbooks as a supplementary resource and change over time.

 

> oecdoku %>% filter(IND == "8UTPR" | IND == "8UTSR")

# A tibble: 392 × 15

   LOCATION        Country   IND

      <chr>          <chr> <chr>

1       AUS      Australia 8UTPR

2       AUS      Australia 8UTPR

3       AUT        Austria 8UTPR

4       AUT        Austria 8UTPR

5       CZE Czech Republic 8UTPR

6       CZE Czech Republic 8UTPR

7       DNK        Denmark 8UTPR

8       DNK        Denmark 8UTPR

9       DEU        Germany 8UTPR

10      DEU        Germany 8UTPR

# ... with 382 more rows, and 12 more variables: Indicator <chr>,

#   PER <chr>, Period <chr>, GRD <chr>, Grade <chr>, FLD <chr>,

#   Field <chr>, MSR <chr>, Measure <chr>, Value <dbl>, `Flag

#   Codes` <chr>, Flags <chr>

Filtrelemede ‘ve’ ile birleştirmek istedim, ama çalışmadı. Neden & çalışmadı???

 

> textbooksr <- oecdoku %>% filter(IND == "8UTSR" | MSR == "Percentage")

> textbooksr

# A tibble: 196 × 15

 

 

 

En son olarak textbooksr içine ikinci kaynak olarak kitap okutanları ve okuma yüzdelerini filtreledik.

 

> textbooksr <- oecdoku %>% filter(IND == "8UTSR" | MSR == "Percentage")
> textbooksr
# A tibble: 196 × 15
   LOCATION        Country   IND
      <chr>          <chr> <chr>
1       AUS      Australia 8UTSR
2       AUS      Australia 8UTSR
3       AUT        Austria 8UTSR
4       AUT        Austria 8UTSR
5       CZE Czech Republic 8UTSR
6       CZE Czech Republic 8UTSR
7       DNK        Denmark 8UTSR
8       DNK        Denmark 8UTSR
9       DEU        Germany 8UTSR
10      DEU        Germany 8UTSR
# ... with 186 more rows, and 12 more variables: Indicator <chr>,
#   PER <chr>, Period <chr>, GRD <chr>, Grade <chr>, FLD <chr>,
#   Field <chr>, MSR <chr>, Measure <chr>, Value <dbl>, `Flag
#   Codes` <chr>, Flags <chr>

 

 

 

 

Sonuç olarak, OECD ülkelerinde ders kitabını yardımcı kaynak olarak kullanımı yüzdeleri grafiğini çizdirdik.

 

ggplot(data=textbooksr,aes(x=Value,y=Country))+geom_point()

 

 

 

Akademik Bilişim 2017, Aksaray Üniversitesi, Aksaray

R ile Veri Analizi Eğitimi Projesi

Alev Elçi

Ömer Faruk Yılmaz